以ChatGPT为代表的生成式人工智能在税务领域应用的思考和建议
作者:
国家税务总局深圳市税务局课题组
2022年年底,ChatGPT一经推出,就凭借其出色的语言理解、内容生成、知识推理、多轮沟通能力,迅速得到了大量用户追捧,还受到了各国政府、企业界、学术界的广泛关注。ChatGPT的出现被广泛认为将人工智能带入了一个新的发展阶段,推动智能化时代的快速到来。
ChatGPT是生成式人工智能(Artificial Intelligence Generated Content,AIGC)技术的代表产品,国内科技企业、高校、科研院所也在近期发布了一系列AIGC类产品,AIGC类产品迅速呈现百花齐放的局面。与此同时,人们对于此类产品在数据安全、道德伦理、信息垄断等方面的担忧也日益加剧,不少国家出台了相应的限制性措施。2023年4月11日,国家互联网信息办公室发布《生成式人工智能服务管理办法(征求意见稿)》,对生成式人工智能服务的合规、合法、合理性进行了规范。面对突飞猛进的人工智能技术和潜在的应用风险,税务部门应如何取长补短、妥善应对,成为值得我们深入研究思考的课题。
(一)ChatGPT的演进历程
从2018年发布GPT-1至今,GPT已进行5次产品升级。与GPT-1相比,ChatGPT运算层扩大7倍(从12层增加到96层)、参数增加1 000多倍(从1.17亿个增加到1 750亿个)、预训练数据量扩大9 000多倍(从5GB增加到45TB),而其产品表现也得到了显著提升:推理能力更强,对上下文理解更加准确,可执行任务更加多样化,输出结果更加符合人脑思维。
2023年3月,GPT-4正式发布,除模型容量更大、生成质量更高、计算性能更强外,其对文本、图像、音频、视频等进行统一知识表示的多种模态融合能力尤其令人印象深刻。这将是未来AIGC的重点发展方向。人工智能将与人类一样拥有多种信息感知渠道,从而具备更高的智能水平。
(二)ChatGPT的突出特点
与传统弱人工智能只专注于完成某个特定的任务相比,ChatGPT不再局限于完成单一任务,而是具备多轮对话、文本生成、文本分类、代码生成、摘要、翻译等多种能力,表现出更高的人机交互水平和强大的逻辑推理能力,能够更准确地理解用户意图,与用户进行多轮对话,并从与用户的互动中学习,展现出类人的社交属性。
ChatGPT引入人类反馈强化学习,即在模型训练过程中,人类一方面扮演用户与模型对话,另一方面扮演标注员,对模型的回复进行评分,并将更好的结果反馈给模型,促使模型不断强化学习、调整参数,最终输出更符合人脑思维的回答。同时,还可以通过人工高质量无害化标注,促使ChatGPT树立正确的价值观。
(三)ChatGPT的不足之处
ChatGPT在展现优异能力的同时,也存在明显的不足与缺陷,主要表现为以下几个方面。
1.在专业领域上表现欠佳。ChatGPT的大规模语言模型的训练数据是互联网上公开的通用数据,没有经过金融、法律、税务等专业领域数据训练和标注,对专业问题的回复显得“业余”。
2.可信性无法保证。ChatGPT对某些问题的回复往往语句通畅、貌似合理,但有时与实际情况相比却大相径庭,目前模型还不能提供合理的证据进行可信性的验证。
3.时效性差。ChatGPT知识范围局限于模型进行预训练时间之前的数据,无法实时地融入新知识,可回答的知识范围有明显的边界。
4.难以完全屏蔽有害内容。ChatGPT的大规模语言模型是基于现实世界的语言数据预训练而成,因为部分数据的偏见性,很可能生成有害内容,虽然ChatGPT进行了无害化标注,但用户仍可以绕过屏蔽得到有害回复。
5.成本高昂。ChatGPT模型训练成本高、部署困难、每次调用花费不菲,并对工程能力有很高的要求。
二、当前人工智能在税务领域应用的现状和存在的差距
近年来,各级税务机关持续创新,主动适应人工智能时代的新特点、新要求和新挑战,大力推行网上智能办税、智能咨询,探索构建税费精细服务供给新格局:已经实现了部分税费种的自动预填报功能;12366纳税缴费服务热线引入人工智能的互动语音应答、机器人学习等技术,实现部分智能问答;对纳税人进行画像,探索税费事项精准推送等。然而,当前税务领域的人工智能应用与以ChatGPT为代表的国际领先水平的AIGC类产品应用相比仍存在较大差距,主要表现在以下几个方面。
(一)应用层次“浅”
人工智能在税费服务领域的应用还停留在浅层、表层,在语言理解、逻辑推理、多轮对话、智慧服务方面显得差强人意。例如,12366纳税缴费服务热线的智能咨询只能实现从业务知识库中搜索高度关联的结果推送给纳税人,还未实现类人的多轮交互。
(二)应用范围“窄”
从业务功能看,目前只在智能咨询、智能呼叫、线上办税、政策推送、导税机器人等场景作了若干尝试,而在税收宣传、大企业税务管理等专业化服务、线上导办、线下导引等方面还未开展有效的应用。从服务内容看,更多地运用于税收服务,对费的服务支持不够。
(三)人才支撑“弱”
提升人工智能在税务领域应用的深度和广度,需要大量既懂业务、又懂技术的复合型人才予以支撑,而当前税务系统在人工智能方面的人才储备不足,且尚未形成有效的培养路径。
(一)国产AIGC类产品百花齐放,为在税务领域应用提供多种选择
目前,以ChatGPT为代表的AIGC类产品的成熟应用均为国外厂商开发,不支持私有化部署,仅可通过调用在线接口进行二次开发。从信息安全角度考虑,直接引进此类模型存在较大的风险和困难。事实上,我国人工智能算法的龙头厂商在AIGC领域也有深厚的技术储备。比如,百度的文言一心、华为的鹏城盘古大模型、复旦大学的MOSS、清华大学的ChatGLM等模型,在文本处理领域的智能水平均可达到GPT-3以上;阿里巴巴的通义千文、腾讯的混元AI等,正在积极拓展大语言模型人工智能的应用场景,推动技术赋能产业升级;中国科学院自动化研究所的紫东太初能实现视觉、文本、语音三模态的统一表达和高效协同。国内AIGC类产品丰富且各有所长,使得AIGC类产品在税务领域应用并开展私有化部署有了更大的选择空间。此外,为支撑AIGC的算力,我国商汤、海光信息、寒武纪等企业自主研发的人工智能处理器也达到业界先进水平,可为AIGC类产品在税务领域应用提供坚实的算力支撑。
(二)税费数据充裕,可以助推AIGC类产品成为税务领域专家
人工智能的本质是机器模型通过学习大量的样本数据来归纳规律和习得知识,从而表现出符合人类预期的行为。换句话说,用什么样的数据来“喂养”模型,就会得到什么样的模型。因此,数据才是重中之重。税务大数据已初具规模。以深圳市税务局为例,目前已有各类数据1 000余亿条,达133TB。在此基础上,依托12366纳税缴费服务热线税收业务知识库、专业客服等强大支撑,完全有条件对现有的AIGC类产品进行专业化“培训”,使其在具备人脑思维的基础上成为税收业务专家,为税务工作智慧化发展提供更强动力。
(三)多措并举,可以有效化解AIGC技术缺陷
AIGC作为一项新的技术,目前还存在可信性无法保证、时效性差、难以完全屏蔽有害内容等不足之处,但是在税务领域,是可以通过多种措施加以解决的。在保证AIGC回复的可信性方面,可以使用引入政策库、知识库链接等方式,增加其可信性。在保证时效性方面,可以将AIGC与搜索引擎打通,提升回复的时效性。在减少有害内容方面,可以将AIGC的回复仅限定于税务领域,不回答可能涉及的道德伦理类问题。
当然,也要看到创建税务领域的AIGC模型,需要投入大量的人力、物力、财力,开展有针对性的训练,特别是数据整备、信息归集、算力支撑、专家标记、参数调精等工作,均需消耗大量资源。为此,应提前谋划,加大资金投入、人才储备,为AIGC类产品在税务领域应用提供支持。
以ChatGPT为代表的AIGC技术在税务领域可以发挥重要作用:基于丰富的12366纳税缴费服务热线税收业务知识库、政策法规库、税收文件等税务领域知识,充分运用其多轮对话、代码生成等能力,开展精细化、个性化、智能化服务,广泛运用于12366纳税缴费服务热线、电子税务局、征纳互动平台、线下办税服务厅等渠道,优化税收宣传、税收政策咨询、办税流程、预约办理、预先服务、需求响应、舆情管理等,重新构建税费服务新格局。
(一)快速生成高质量税收宣传材料
在税收宣传领域,AIGC类产品可以扮演智能助手角色。具体而言,可以充分运用其多轮对话能力,根据不同的税法宣传侧重点及纳税人的个性化需求,快速生成图文并茂的宣传稿、视频课程,甚至编写典型案例,生成“人人都能看懂”的税收政策指导文件,降低政策学习的门槛,促进有关政策落实到位。
(二)提供差异化的精准政策推送
AIGC类产品强大的多轮对话和代码生成能力,可以实现根据政策描述精准解析适用对象,自动编写脚本语言语句,筛选出符合条件的纳税人清单,计算纳税人可享受优惠的金额,选择最优惠的税费享受政策组合,精准推送政策适用具体条款,做到一户一策、一户一案例、一户一填报,为纳税人缴费人提供“千人千面”的精细化、差异化服务。
(三)开展预研判的精准指引服务
运用AIGC类产品,可以根据纳税人办税习惯、办理业务类型,提前预判纳税人需求,结合纳税人地址、时间等维度的信息,主动推送相关政策解读、业务办理渠道、系统操作指引、常见问题解答、典型案例等,通过开展精准指引服务,提升纳税人办税体验。
(四)提升智能咨询服务水平
提升12366纳税缴费服务热线智能咨询的效能,充分发挥其一个大脑、海量记忆、知识全面、一对N且“7×24小时”无休服务的优势,不仅能解决当前纳税咨询量巨大导致的咨询难、答疑慢的问题,还能不受答疑人员个人素质、知识储备、业务经验的影响,提供全面、准确、客观、一致的答复。快速响应重大事项,当出现系统故障时,传统的纳税咨询反馈链条较长,需要较长时间才能发现问题,而AIGC类产品可以第一时间检测到问题并快速响应处置。AIGC类产品可以定期总结纳税人“急难愁盼”的热点问题,自动生成运营报告,并提出改进建议。
(五)强化大企业税收内控服务
AIGC类产品可以通过自动抓取大企业财务系统数据,智能生成财务报表、申报表等税务报表;通过分析企业财务数据,智能识别税务风险点,进行预警;基于海量互联网信息进行学习,建立企业股权变更行为模型等风险模型,发现企业重大行为中可能存在的税款漏缴行为,及时发出预警。
(六)提供全方位线上导办服务
在电子税务局等线上渠道应用AIGC类产品,可根据纳税人的任务状态,推荐相应的业务入口,并根据指令,结合系统内已有的纳税人涉税信息、行为数据、历史办税记录等,为纳税人提供自动填单、填写指引、填写说明、逻辑比对等服务,辅助纳税人完成相关业务的办理,提高纳税人涉税业务的办理效率。
(七)打造线下元宇宙办税服务厅
使用AIGC类产品可以提升导税机器人智能化水平,提供办税服务厅智能咨询、引导、帮办服务,助力打造元宇宙办税服务厅,实现为基层减负和提升纳税人体验的双重效益。
(八)精准开展热点追踪、舆情管理、问计问需服务
一方面,可以使用AIGC类产品开展需求收集。利用AIGC类产品强大的信息收集处理能力,分析互联网上社会关注的热点问题,总结提炼广大网民的需求,主动开展政策研究。另一方面,可以使用AIGC类产品开展跟踪问需。通过互联网主动实时抓取涉税舆情,提前研判,主动开展跟踪问需。
(一)高度重视,加强顶层设计
AIGC类产品在业界产生巨大影响,为人工智能技术发展指明了方向,微软、谷歌等头部公司均在各类产品中使用AIGC技术提升生产力。国内外成功应用案例值得我们借鉴。该技术能够突破税务机关的生产力约束,重构现有业务运转模式、管理体系,极大加速税收现代化的进程。税务机关应主动识变应变求变,提前谋划,做好顶层设计,将AIGC技术落地税务领域列入税收现代化建设的重要内容,为实现税收现代化提供更强大的技术和智力支撑。
(二)聚焦税费服务领域,打造独特的AIGC类税务产品
AIGC类产品可以面向海量用户提供类人的交互体验,税务机关面对海量纳税人缴费人的税费服务需求,是AIGC类产品最容易产生应用效果的领域。税收数据积累深厚,具有得天独厚的优势,我们应把握机遇,以服务纳税人缴费人为突破口,聚焦在税务专属领域的典型应用垂直深耕、做深做透,打造独特的AIGC类税务产品。短期看,考虑到数据和资源的可得性,AIGC类产品可用于提升12366纳税缴费服务热线、聊天机器人的智能咨询水平,使纳税人缴费人高效、准确地获得税费政策和指引。同时,也可用于税收宣传筹划等文本类工作,帮助税务人员提高工作效率。中期看,随着隐私计算的发展,AIGC类产品可以使用税务私有数据,开展精准推送、预研预判、自动填单、风险识别等自动化分析和业务办理。长期看,随着AIGC类产品与各类虚拟工具的结合,可以实现企业报表智能生成、税务内控智能分析,并自行开展税务审计等高级别工作。
(三)引入高端智库,与国内领先机构开展深度合作
适当引入国内成熟的、产权可控、安全的商用AIGC类产品,与国内一流厂商加强合作,将AIGC更好地运用于税务领域。加强与各大科研院所的合作,引入高端人才打造高端智库,做到强强联合,产、学、研互相促进,发挥优势,形成共识,打造人工智能应用的联盟链。
(四)设立创新实验室,主动探索积累经验
选取若干先进地区开展创新试点,鼓励深圳等经济发达、科技基础强、条件成熟、技术相对较好的地区设立创新实验室,找准AIGC类产品与税收业务的结合点,主动开展创新探索,为AIGC赋能税收现代化积累经验。
(五)坚持长期投入,逐步深化应用
AIGC类产品发展速度迅猛,发展前景广阔,但是需要坚持人、财、物的长期投入,分阶段分步骤实施。要做好实施方案的目标规划、路径设计,针对人工智能技术发展的方向,逐步加大投入,满足广阔的应用场景建设需要。在资金支持上,对AIGC技术的引入落地实施予以适当的倾斜。在人才支持上,需要聚集多领域高端人才,成立包括技术人员、业务人员、标注人员的专业团队,开展算法研究、参数调精、数据标注等工作,为AIGC技术的落地提供智力支持。
(本文为节选,原文刊发于《税务研究》2023年第6期。)
欢迎按以下格式引用:
国家税务总局深圳市税务局课题组.以ChatGPT为代表的生成式人工智能在税务领域应用的思考和建议[J].税务研究,2023(6):5-9.
-END-
●水资源税与环境保护税的水生态环境保护效应研析——基于污水减排效应的分析
●“双碳”目标下我国车辆购置税和车船税的改革建议:国际经验与借鉴
●认知智能在税收征管数字化升级和智能化改造中的应用研究——兼论税收智能系统的建构
●增值税改革在制度完善中为经济发展赋动能——新时代十年增值税改革述评